智能论文笔记

Support Vector Machines with the Hard-Margin Loss: Optimal Training via Combinatorial Benders' Cuts

Ítalo Santana , Breno Serrano , Maximilian Schiffer , Thibaut Vidal

分类：机器学习

2022-07-15

由于其损耗函数的无限性，经典的铰链损耗支撑矢量机（SVM）模型对异常观测值敏感。为了解决这个问题，最近的研究集中在非凸损失函数上，例如硬质量损失，该损失将恒定的罚款与任何错误分类或细边样品内的样本相关联。应用此损失函数可为关键应用带来急需的鲁棒性，但它也导致NP硬化模型，这使训练变得困难，因为当前的精确优化算法显示有限的可伸缩性，而启发式方法无法始终找到高质量的解决方案。在这种背景下，我们提出了新的整数编程策略，这些策略可显着提高我们将硬利润SVM模型培训为全球最优性的能力。我们引入了一种迭代采样和分解方法，其中使用较小的子问题来分离组合弯曲器的切割。这些切割量在分支和切割算法中的使用，可以更快地收敛到全球最佳。通过对经典基准数据集的大量数值分析，我们的解决方案算法首次求解了117个新数据集，以达到最佳性，并在基准最困难的数据集的平均最佳差距中降低了50％。

translated by 谷歌翻译

Deep Learning for Diagonal Earlobe Crease Detection

Sara L. Almonacid-Uribe , Oliverio J. Santana , Daniel Hernández-Sosa , David Freire-Obregón

分类：计算机视觉

2022-10-20

An article published on Medical News Today in June 2022 presented a fundamental question in its title: Can an earlobe crease predict heart attacks? The author explained that end arteries supply the heart and ears. In other words, if they lose blood supply, no other arteries can take over, resulting in tissue damage. Consequently, some earlobes have a diagonal crease, line, or deep fold that resembles a wrinkle. In this paper, we take a step toward detecting this specific marker, commonly known as DELC or Frank's Sign. For this reason, we have made the first DELC dataset available to the public. In addition, we have investigated the performance of numerous cutting-edge backbones on annotated photos. Experimentally, we demonstrate that it is possible to solve this challenge by combining pre-trained encoders with a customized classifier to achieve 97.7% accuracy. Moreover, we have analyzed the backbone trade-off between performance and size, estimating MobileNet as the most promising encoder.

translated by 谷歌翻译

A Robust Scientific Machine Learning for Optimization: A Novel Robustness Theorem

Luana P. Queiroz , Carine M. Rebello , Erber A. Costa , Vinicius V. Santana , Alirio E. Rodrigues , Ana M. Ribeiro , Idelfonso B. R. Nogueira

分类：机器学习

2022-09-13

科学机器学习（SCIML）是对几个不同应用领域的兴趣越来越多的领域。在优化上下文中，基于SCIML的工具使得能够开发更有效的优化方法。但是，必须谨慎评估和执行实施优化的SCIML工具。这项工作提出了稳健性测试的推论，该测试通过表明其结果尊重通用近似值定理，从而确保了基于多物理的基于SCIML的优化的鲁棒性。该测试应用于一种新方法的框架，该方法在一系列基准测试中进行了评估，以说明其一致性。此外，将提出的方法论结果与可行优化的可行区域进行了比较，这需要更高的计算工作。因此，这项工作为保证在多目标优化中应用SCIML工具的稳健性测试提供了比存在的替代方案要低的计算努力。

translated by 谷歌翻译

A new Reinforcement Learning framework to discover natural flavor molecules

Luana P. Queiroz , Carine M. Rebello , Erbet A. Costa , Vinícius V. Santana , Bruno C. L. Rodrigues , Alírio E. Rodrigues , Ana M. Ribeiro , Idelfonso B. R. Nogueira

分类：机器学习

2022-09-13

味道是遵循社会趋势和行为的风味行业的焦点。新调味剂和分子的研究和开发在该领域至关重要。另一方面，自然风味的发展在现代社会中起着至关重要的作用。鉴于此，目前的工作提出了一个基于科学机器学习的新颖框架，以在风味工程和行业中解决新的问题。因此，这项工作带来了一种创新的方法来设计新的自然风味分子。评估了有关合成可及性，原子数以及与天然或伪天然产物的相似性的分子。

translated by 谷歌翻译

Towards cumulative race time regression in sports: I3D ConvNet transfer learning in ultra-distance running events

David Freire-Obregón , Javier Lorenzo-Navarro , Oliverio J. Santana , Daniel Hernández-Sosa , Modesto Castrillón-Santana

分类：计算机视觉

2022-08-23

预测运动员基于短录像的表现是高度挑战的。绩效预测需要高领域知识和足够的证据来推断适当的质量评估。体育专家通常可以实时推断这种信息。在本文中，我们提出了回归超速赛跑者累积比赛时间（CRT）的回归，即自比赛开始以来，跑步者一直在采取行动，仅将几秒钟的录像作为输入。我们稍微修改了I3D Convnet主链，并为此训练了新添加的回归器。我们使用视觉输入的适当预处理，以从特定的跑步者进行转移学习。我们表明，由此产生的神经网络可以为短输入素材提供出色的性能：在估计8到20小时的跑步者的CRT时，平均绝对误差为18分钟半。我们的方法具有几个有利的特性：它不需要人类专家提供任何见解，可以通过观察跑步者在比赛中的任何时刻使用它，并且可以在任何给定时间告诉比赛人员有关跑步者的信息。

translated by 谷歌翻译

A Study on the Impact of Data Augmentation for Training Convolutional Neural Networks in the Presence of Noisy Labels

Emeson Santana , Gustavo Carneiro , Filipe R. Cordeiro

分类：计算机视觉

2022-08-23

标签噪声在大型现实世界数据集中很常见，其存在会损害深神网络的训练过程。尽管几项工作集中在解决此问题的培训策略上，但很少有研究评估数据增强作为培训深神经网络的设计选择。在这项工作中，我们分析了使用不同数据增强的模型鲁棒性及其在嘈杂标签的存在下对培训的改进。我们评估了数据集MNIST，CIFAR-10，CIFAR-100和现实世界数据集Clothing1M的最新和经典数据增强策略，具有不同级别的合成噪声。我们使用精度度量评估方法。结果表明，与基线相比，适当的数据增强可以大大提高模型的稳健性，可将相对最佳测试准确性的177.84％提高到177.84％的相对最佳测试准确性，而无需增强，并且随着绝对值增加了6％，而该基线的绝对值增加了6％最先进的Dividemix培训策略。

translated by 谷歌翻译

Correcting Model Bias with Sparse Implicit Processes

Simón Rodríguez Santana , Luis A. Ortega Andrés , Daniel Hernández-Lobato , Bryan Zaldívar

分类： (统计)机器学习 | 机器学习

2022-07-21

机器学习中的模型选择（ML）是贝叶斯学习程序的关键部分。模型选择可能会对由此产生的预测施加强大的偏见，这可能会阻碍贝叶斯神经网络和神经采样器等方法的性能。另一方面，贝叶斯ML的新提出的方法具有隐式随机过程（高斯过程的概括）的功能空间中近似推断的特征。在这方面，稀疏隐式过程（SIP）的方法特别成功，因为它是完全可训练的，并且可以实现灵活的预测。在这里，我们扩展了原始实验，以表明当数据生成机制与模型所隐含的机制大不相同时，SIP能够纠正模型偏差。我们使用合成数据集证明SIP能够提供预测性分布，这些分布比初始模型的初始模型的确切预测更好地反映了数据。

translated by 谷歌翻译

Predicting Parking Lot Availability by Graph-to-Sequence Model: A Case Study with SmartSantander

Yuya Sasaki , Junya Takayama , Juan Ramón Santana , Shohei Yamasaki , Tomoya Okuno , Makoto Onizuka

分类：机器学习

2022-06-21

如今，为了改善服务和城市地区的宜居性，全世界正在进行多个智能城市计划。 SmartSantander是西班牙桑坦德市的一个智能城市项目，该项目依靠无线传感器网络技术在城市内部部署异质传感器，以测量多个参数，包括户外停车信息。在本文中，我们使用SmartSantander的300多个户外停车传感器的历史数据研究了停车场可用性的预测。我们设计了一个图形模型，以捕获停车场的定期波动和地理位置。为了开发和评估我们的模型，我们使用了桑坦德市的3年停车场可用性数据集。与现有的序列到序列模型相比，我们的模型具有很高的精度，该模型足够准确，可以在城市提供停车信息服务。我们将模型应用于智能手机应用程序，以被公民和游客广泛使用。

translated by 谷歌翻译

Deep Variational Implicit Processes

Luis A. Ortega , Simón Rodríguez Santana , Daniel Hernández-Lobato

分类： (统计)机器学习 | 机器学习

2022-06-14

隐式过程（IP）是高斯过程（GPS）的概括。 IP可能缺乏封闭形式的表达，但很容易采样。例子包括贝叶斯神经网络或神经抽样器。 IP可以用作功能的先验，从而产生具有良好预测不确定性估计值的灵活模型。基于IP的方法通常进行函数空间近似推断，从而克服了参数空间近似推断的一些困难。然而，所采用的近似值通常会限制最终模型的表现力，结果是\ emph {e.g。}，在高斯预测分布中，这可能是限制的。我们在这里提出了IPS的多层概括，称为“深层隐式”过程（DVIP）。这种概括与GPS上的深GPS相似，但是由于使用IPs作为潜在函数的先前分布，因此更灵活。我们描述了用于训练DVIP的可扩展变异推理算法，并表明它的表现优于先前的基于IP的方法和深度GPS。我们通过广泛的回归和分类实验来支持这些主张。我们还在大型数据集上评估了DVIP，最多可达数百万个数据实例，以说明其良好的可扩展性和性能。

translated by 谷歌翻译

Gait Recognition Based on Deep Learning: A Survey

Claudio Filipi Gonçalves dos Santos , Diego de Souza Oliveira , Leandro A. Passos , Rafael Gonçalves Pires , Daniel Felipe Silva Santos , Lucas Pascotti Valem , Thierry P. Moreira , Marcos Cleison S. Santana , Mateus Roder , João Paulo Papa

分类：计算机视觉 | 机器学习

2022-01-10

通常，基于生物谱系的控制系统可能不依赖于各个预期行为或合作适当运行。相反，这种系统应该了解未经授权的访问尝试的恶意程序。文献中提供的一些作品建议通过步态识别方法来解决问题。这些方法旨在通过内在的可察觉功能来识别人类，尽管穿着衣服或配件。虽然该问题表示相对长时间的挑战，但是为处理问题的大多数技术存在与特征提取和低分类率相关的几个缺点，以及其他问题。然而，最近的深度学习方法是一种强大的一组工具，可以处理几乎任何图像和计算机视觉相关问题，为步态识别提供最重要的结果。因此，这项工作提供了通过步态认可的关于生物识别检测的最近作品的调查汇编，重点是深入学习方法，强调他们的益处，暴露出弱点。此外，它还呈现用于解决相关约束的数据集，方法和体系结构的分类和表征描述。

translated by 谷歌翻译